250416 三花AI日报: ChatGPT 新增图库功能; Gemini 文生视频 & Whisk 图生视频;Mogao 模型揭晓:字节 Seedream 3.0;智谱AI启动A股上市流程并开源三大模型;快手可灵 2.0 大师版发布

OpenAI 为 ChatGPT 新增图片库管理功能

OpenAI ChatGPT 正式推出图片库管理功能,用户所有生成的 AI 图片都将自动归档于此。

该功能已同步上线 Web 端和移动端,终于不用再在聊天记录里找了。

谷歌推出 Gemini 文生视频 & Whisk 图生视频

谷歌在其旗下的 Gemini 和 Whisk 应用中引入了由 Veo2 驱动的视频生成功能,需要 Gemini Advanced 或 Google One AI Premium 订阅才能使用。

可以在 Gemini 中进行文生视频,在 Whisk 中进行图生视频,最高能生成 8 秒 720p 的视频。

Mogao 模型揭晓:字节 Seedream 3.0

昨日登顶 Artificial Analysis 榜首的 Mogo 模型现已揭晓,居然是字节跳动发布的 Seedream 3.0(即梦 3.0)模型。

该模型拥有业界领先的人像生成质感;目前最强的汉字排版能力;最高支持 2K 分辨率输出。

国内用户可以直接在即梦 AI 平台体验,国际用户则需要填写表单申请测试

如果是开发者的话可以通过火山引擎接入该模型,目前定价为 0.2 元/张

智谱AI启动A股上市流程并开源三大模型

智谱AI 于 4 月 14 日在北京证监局正式办理上市辅导备案,目标是争取 2025 年内完成 A 股上市。

同时,智谱AI 还开源了 3 个模型

  • GLM4 32B 0414:基础大模型,能力对标 DeepSeek V3

  • GLM Z1 32B 0414:专为推理任务优化的版本,对标 DeepSeek R1

  • GLM Z1 Rumination:针对 Agent 场景特别强化训练的专用模型

这些模型现已开源,佬们也可通过智谱新买的域名 z.ai 直接体验。

快手可灵 2.0 大师版发布

可灵 2.0 大师版视频生成模型正式发布,带来三大核心升级:

  1. 语义理解能力显著增强,响应更精准

  2. 动态画面质量全面提升,支持大幅运动场景

  3. 画面质感优化,连续画面更流畅自然

同步推出的可图 2.0 图片生成模型也迎来重要更新,新增局部重绘、智能扩图和风格转绘三大实用功能。

不过可灵 2.0 的价格有点问题,生成 5 秒视频就要 10 块钱(这可能是我的问题,不是它的问题)。

31 Likes

每日读报

每日看报

一打开ld就能看到三花日报

每日前排看报

谷歌这个感觉还不错呀

看报看报

现在发快讯要版主审核了哎

每日看报

太棒了 是三花早报!

1 Like

今日看报

每日看报

对标R1 的32B模型 就像一个潘多拉魔盒的钥匙,阿里云拿到 立马绝对要投资几千亿,现在zhipu 也要上市,如果o3-mini 也是这个级别的话,stargate 也就应证了这一点

1 Like

每日看报

两者架构不一样,deepseek实际激活参数也才36B,是专家数据多而已。如果核心参数很大,推理速度就很慢了。

至于对标R1,仅仅只是加了一个思考链吧 。一些新的开源小模型都上思考链了,效果确实立竿见影。

2 Likes

看报啦~

我来看看。

每日看报

每日看报

每日看报