241122 三花 AI 日报：谷歌 Gemini 模型重夺竞技场榜首；京东健康数字人头；黑森林实验室 FLUX Tools；Tülu 3：完全开放的大模型

ke_jun · 2024 年11 月 22 日 01:18

阿里 In-Context LoRA：高效多场景精准出图

In-Context LoRA 是阿里最近非常火的一个项目。上次介绍时，模型还未开放，现在官方已经放出了 10 个预训练模型。社区围绕它开发了多种工作流，如虚拟试穿、品牌设计、对象迁移和角色扮演等。

IC LoRA 基于 Flux 这玩意生成的效果非常好，电商领域一定能打出一片天。

配图使用 Logo in Context 制作，这也是利用了 IC LoRA。配合图生图技术，可以将任何 Logo 融入到任何事物中。

京东健康开源音频驱动的数字人头项目 JoyVASA

JoyVASA 是京东健康开源的一个音频驱动的数字人头项目，它不仅支持唇形一致和表情控制，还能为动物生成数字头。这类技术在市场上非常多，有需求的读者可以在三花上搜索‘数字人’，不过真正落地的不多，JoyVASA 看起来是个不错的选择。

Black Forest Labs 发布 FLUX Tools：官方支持的控制模型

黑森林实验室（Black Forest Labs）发布了 FLUX Tools 系列模型，包括：

Fill 支持局部重绘和扩图
Depth & Canny 官方 Controlnet 模型
Redux 图像参考图生图
这些模型均已开放下载，并基于 Flux dev 的开源协议。ComfyUI 发文表示第一时间支持了这些模型，官方下场做生态，好日子来了。

Tülu 3：完全开放的大模型

Tülu 3 70B & 8B 是一个完全开放数据、评估代码和训练算法的大模型。在 12 项基准测试中，其平均得分超越了许多同参数量开源模型，特别是 70B 模型，其表现甚至超越了 GPT4o-mini，直逼 claude 3.5 haiku。官方宣称，他们的目标是让任何人都能后训练模型，因此不仅开放了权重，还一并开放了整套基础设施。非常的酷

谷歌 Gemini 模型重夺竞技场榜首

谷歌 AiStudio 上新了实验性的 gemini-exp-1121 模型，该模型在 lmarena 上超越了昨天 OpenAI 发布的新 4O 模型，重新夺得了榜首。好家伙，回合制，OpenAI 第一的位置屁股还没坐热呢。

SGYH · 2024 年11 月 22 日 01:20

又到了看报的时间了

Qiner · 2024 年11 月 22 日 01:21

就是完全开源的意思？

yyy3 · 2024 年11 月 22 日 01:50

感谢你的分享

linuxlove · 2024 年11 月 22 日 01:56

我比较关心回合制，希望claude也来参一脚

ke_jun · 2024 年11 月 22 日 02:42

哈哈哈，俺也一样

aepax · 2024 年11 月 22 日 02:45

这个牛逼啊

handsome · 2024 年11 月 22 日 02:47

来了，看报！

qingyang_du · 2024 年11 月 22 日 03:16

gemini真香

cnm · 2024 年11 月 22 日 03:19

mistral 2411呢，这一点波也没有啊

byx · 2024 年11 月 22 日 03:33

黑森林画图是真的牛，就是价钱太贵了

yuyu0.0 · 2024 年11 月 22 日 06:56

Gemini基本都是免费，没有多少付费点

Gemini真烧钱与openai斗呀

不像claude那样繁忙时间段限制使用和封号，但claude3.5的代码能力真是遥遥领先

midpoint2005 · 2024 年11 月 22 日 09:50

提供一个“三花快讯”的订阅源：
https://rssweball.top/feed/f6d4dac7-c071-4a98-a845-29c2486dca25.xml

话题		回复	浏览量
241112 三花 AI 日报：阿里 Qwen2.5-Coder 全系列开源；Vision Pro 与 ComfyUI 结合；轨迹控制视频插帧在线使用；谷歌开源诺奖项目 AlphaFold 3 前沿快讯人工智能	11	572	2024 年11 月 12 日
241121 三花AI日报：OpenAI 的 GPT-4o 模型重夺竞技场榜首；DeepSeek 推出全新推理模型 R1-Lite 预览版；谷歌推出专为教育研究微调的 AI 模型前沿快讯人工智能	9	756	2024 年11 月 21 日
241014 三花AI日报：把 L 站的 Shared Chat 设置为默认搜索引擎；实时渲染 CS:GO 的扩散模型；首个去中心化模型训练启动；开源 3D 数字人头框架；OpenAI 开源多智能体框架；开源可商用 TTS 模型；表情包自由LoRA 前沿快讯人工智能	27	1415	2024 年11 月 7 日
2024年AI大事纪搞七捻三人工智能	2	262	2024 年12 月 31 日
241204 三花 AI 日报：AI 线稿上色与自动分层技术；腾讯开源混元文生视频模型；高性能生图模型 Luma Photon；海螺发布 I2V-01-Live；谷歌 Vertex AI 上线 Veo 前沿快讯人工智能	10	563	2024 年12 月 4 日