Gemini 新增了一个 gemini-2.0-flash-exp-image-generation
的新模型,该模型支持输出图文内容。
本次更新聚焦于更强大的图文能力和性能优化:
- 全新图文模型: 新增支持
gemini-2.0-flash-exp-image-generation
模型,可生成包含图文混排的内容。
- 图片体积优化: 生成的图片将自动压缩,减小文件大小。
- 图片加载优化: 采用懒加载技术优化图片加载,减少图片渲染对文本生成速度的影响。
现在,您可以体验更丰富的图文互动和更流畅的内容生成速度!
以下是图文内容生成测试:
- 生成做菜的流程和配图:
我在学做宫保鸡丁,你可以教我做菜的步骤,并配上相应的图片么
- 测试脑筋急转弯:
我想知道怎么把一只大象装进冰箱,请列出步骤与每一步的图片
- 测试图片修改能力:
生成一辆红色跑车的图片
Gemini 应该目前唯一可以直接生成图文混排内容的大模型语言。如果说 OpenAI 开启了 AI 时代,那么 Google 的 Gemini 绝对是 AGI 时代的领跑者。
当然 Gemini 的新模型觉得不止以上几种用法,比如直接给 Gemini 一篇公众号文章,它就可以为你生成图文混排的全新文章,省去了你找图片的时间,更可以避免图片版权争议。
您可以通过部署 Gemini Next Chat ,然后选择 gemini-2.0-flash-exp-image-generation
这个模型进行试玩。
注意:目前只有 gemini-2.0-flash-exp-image-generation
这个模型支持图文内容生成
模型列表可以在项目右上角的 设置-语言模型-默认模型
进行刷新,右侧的小按钮可以手动刷新模型列表。
107 Likes
skyland
(skyland)
2
非常强大的 Google, 非常强大的 Gemini Next Chat
现在基本是主力了
4 Likes
最近 Gemini 更新太快,有点跟不上脚步了,加上最近在更新用免费的 Gemini 模型实现 Deep Research,不限量、超大杯,感谢 Google 大善人 这个项目,时间完全不够用 
Gemini Next Chat 在规划全新的 2.0 版本,2.0 版本会完全重构原先的代码,会变得更加强大,但开发进度可能会耗时数月。
6 Likes
gemini next chat支持多key轮询吗
1 Like
希望可以加一个设置网络代理的选项,比如socks5,http之类的
2 Likes
一般网络代理可以用第三方软件实现。在这个项目中您可以考虑使用 API 代理
3 Likes
devinfan
(devinfan)
12
提一个修改建议:这个好像能直接感受回车键,只要敲了回车键就会开始对话。很多时候敲回车可能只是想打英文,而不是发文。chatgpt官网和next 以及cherry,都是在输入法阶段,敲了字幕,输入回车不会直接开启问答。
4 Likes
会在 2.0 版本中对输入框进行重构,体验会更贴近主流 app
3 Likes
skyland
(skyland)
16
大佬以后还是只专注 gemini 吗,有没有把其他 LLM 也加进去的想法
2 Likes